Cette base de données provient d’une étude menée en 2013 en Slovaquie par des étudiants en statistiques auprès de leurs proches. Les questions concernent un certain nombre de préférences comme les goûts musicaux, cinématographiques, ou encore des choses comme les traits de personnalités, les phobies, et bien sûr les caractéristiques démographiques des répondants.
La base de données est composée de 150 variables et contient 1010 observations.
Nous allons nous concentrer sur les préférences musicales, et sur les caractéristiques démographiques. Nous omettrons donc le reste des variables.
Les variables présentes concernant la musique dans cette base sont :
Voici l’aperçu des différentes variables qui composent la base de données et des valeurs qu’elles prennent.
| Musique | Rythme | Dance | Folk | Country | Classique | Instrumental | Pop | Rock | Metal_Hardrock | Punk | Hiphop_Rap | Reggea_Ska | Swing_Jazz | Rock_n_Roll | Alternative | Latino | Techno_Trance | Opera | Age | Taille | Poids | Frere_Soeurs | Genre | Droitier_Gaucher | Education | Enfant_unique | Village_Ville | Maison_Appartement |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 5 | 3 | 2 | 1 | 2 | 2 | 1 | 5 | 5 | 1 | 1 | 1 | 1 | 1 | 3 | 1 | 1 | 1 | 1 | 20 | 163 | 48 | 1 | Femme | Droitier | Licence | Non | Village | Appartement |
| 4 | 4 | 2 | 1 | 1 | 1 | 2 | 3 | 5 | 4 | 4 | 1 | 3 | 1 | 4 | 4 | 2 | 1 | 1 | 19 | 163 | 58 | 2 | Femme | Droitier | Licence | Non | Ville | Appartement |
| 5 | 5 | 2 | 2 | 3 | 4 | 5 | 3 | 5 | 3 | 4 | 1 | 4 | 3 | 5 | 5 | 5 | 1 | 3 | 20 | 176 | 67 | 2 | Femme | Droitier | Collège/Lycée | Non | Ville | Appartement |
| 5 | 3 | 2 | 1 | 1 | 1 | 1 | 2 | 2 | 1 | 4 | 2 | 2 | 1 | 2 | 5 | 1 | 2 | 1 | 22 | 172 | 59 | 1 | Femme | Droitier | Licence | Oui | Ville | Maison |
| 5 | 3 | 4 | 3 | 2 | 4 | 3 | 5 | 3 | 1 | 2 | 5 | 3 | 2 | 1 | 2 | 4 | 2 | 2 | 20 | 170 | 59 | 1 | Femme | Droitier | Collège/Lycée | Non | Village | Maison |
| 5 | 3 | 2 | 3 | 2 | 3 | 3 | 2 | 5 | 5 | 3 | 4 | 3 | 4 | 4 | 5 | 3 | 1 | 3 | 20 | 186 | 77 | 1 | Homme | Droitier | Collège/Lycée | Non | Ville | Appartement |
On vérifie le nombre de données manquantes dans la base de données, on remarque qu’il y en a beaucoup. Comme on peut le voir ici, il y a 168 données manquantes, de plus certaines cellules sont vides, on les recode en NA. Leur nombre étant important, il sera peut-être nécessaire de les supprimer pour l’étude descriptive.
On récupère alors 890 sur 1010 observations.
La plupart de nos variables sont codées de 1 à 5, il ne serait pas pertinent de chercher toutes les statistiques pour celles-ci. Les moyennes et écarts-types nous suffiront. Ce ne sera pas le cas pour certaines variables démographiques
| Musique | Rythme | Dance | Folk | Country | Classique | Instrumental | Pop | Rock | Metal_Hardrock | Punk | Hiphop_Rap | Reggea_Ska | Swing_Jazz | Rock_n_Roll | Alternative | Latino | Techno_Trance | Opera | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Median :5.000 | Median :3.00 | Median :3.000 | Median :2.000 | Median :2.000 | Median :3.000 | Median :3.000 | Median :4.000 | Median :4.00 | Median :2.000 | Median :2.000 | Median :3.000 | Median :3.000 | Median :3.000 | Median :3.000 | Median :3.000 | Median :3.000 | Median :2.00 | Median :2.000 | |
| Mean :4.733 | Mean :3.32 | Mean :3.103 | Mean :2.288 | Mean :2.126 | Mean :2.965 | Mean :2.774 | Mean :3.478 | Mean :3.76 | Mean :2.357 | Mean :2.437 | Mean :2.904 | Mean :2.769 | Mean :2.773 | Mean :3.149 | Mean :2.837 | Mean :2.858 | Mean :2.33 | Mean :2.167 |
Ce premier tableau montre les moyennes et les médianes pour les variables codées de 1 à 5 et correspondant aux préférences musicales des répondants.
Quelques graphiques concernant les répartitions de la population en terme démographiques. Même si certaines variables ne seraient pas pertinentes concernant la musique, il est important d’observer la répartition des répondants.
Ces trois premiers graphiques concernent l’âge, le poids et la taille. Concernant le poids, une valeur extrême de 150kg que nous avons choisi de ne pas représenter aussi pour une question d’échelle. Pour l’âge, on observe une majorité de jeunes entre 18/22 ans.
Ces deux graphiques concernent les répartitions en genre des répondants et de leur manualité. Concernant cette dernière, la répartition semblent assez proche de la réalité avec une minorité de gaucher. Pour les genres, l’égalité n’est pas parfaitement respectée, mais cela ne devrait par être gênant pour la suite de l’étude.
Ici, on peut observer les conditions d’enfance du répondants et son degré d’éducation lors de l’enquête. Une majorité ont grandi en ville, expliquant aussi la majorité concernant les appartements, les deux étant probablement corrélés. Pour l’éducation, une majorité sont au collège/lycée, on observait cependant deux valeurs similaires Primaire et Actuellement en primaire que nous avons donc unifiées.
Enfin, concernant le milieu fraternel des répondants, on observe une majorité avec des frères ou sœurs. La répartition du nombre lui est assez proche de la réalité, on peut l’approximer par une loi normale de par le nombre d’observations. Il est important de noter que certains enfant unique ont répondu avoir des frères et sœurs dans les nombres, et inversement. On peut soit les omettre de la base données, soit considérer que ce sont des demi-frères ou demi-sœurs et les garder. C’est cette dernière option que nous avons choisie.
Ces deux premiers graphiques montrent le goût pour la musique et pour le rythme de 1 à 5. Pour la musique, les valeurs correspondent à un degré d’appréciation. Quant au rythme, 1 signifie lent et 5 rapide. Ainsi, on observe qu’une très large majorité des répondants apprécie la musique fortement, et qu’une petite partie l’apprécie de façon plus modérée. Très peu n’aiment pas ça : 19 répondants. Pour le rythme c’est différent, une majorité répond 3, que l’on peut interpréter comme un rythme d’environ 100 à 120 bpm ce qui regroupe une grande majorité des musiques et des styles.
On a choisi ici le terme musiques modernes de par le caractère électronique et récent des styles cités. Les répartitions ne dégage rien de particulier, exceptée pour la Techno/Trance qui est un style de musique particulier avec des rythmes rapides pouvant expliqués la majorité de 1.
Pour les musiques standards, nous avons sélectionné des styles de musiques connus par tous. Comme on aurait pu l’imaginer, la folk et la country n’ont pas l’air de rencontrer un franc succès auprès des jeunes. En revanche, le rock lui est assez apprécié. Pour le classique et le rock’n’roll, les répartitions sont similaires, et semblent dégager une préférence neutre de par la majorité de 3.
On parle ici de styles un peu plus rares, plus “nichés”, en particulier auprès d’une population de jeunes personnes. Cela est renforcé par les graphiques. Pour l’opéra, le punk et le métal, la valeur 1 est majoritaire, montrant une non-appréciation majeure de ces styles. Pour la musique latine, le jazz et le reggae, les avis sont plus neutres et même équilibrés concernant la musique latine.
Ils semblent important de montrer si quelques corrélations existent entre les styles de musique, et peut-être aussi avec certaines variables démographiques.
Ce graphique permet d’observer un certains nombres de choses intéressantes, et ne sont affichés dans ce graphiques que les corrélations dont la p-value est inférieure au seuil de 0.05. On voit plusieurs corrélations au moins supérieur à 0.5 ou plus. Par exemple, entre classique et opéra, le coefficient est de 0.6, cela paraît en effet logique, les deux styles étant assez proches. Il en est de même pour le punk et le métal, avec un coefficient de 0.54, même si celui-ci est peu plus faible. On observe aussi quelques coefficients négatifs, comme entre la pop et le métal.
Nous allons construire une ACP à partir des données recueillies sur les différents styles de musiques. L’analyse par composantes principales permet de représenter en un minimum d’axes (dimensions) un jeu de données de manière à conserver un maximum d’inertie entre les individus. Les axes ainsi créés se nomment composantes principales.
Le but étant de synthétiser l’information et de mettre en lumière la structures des données.
Tout d’abord nous commençons par nous occuper des données manquantes. Il n’est pas possible de les supprimer car nous perdrions trop d’informations. C’est pourquoi nous choisissons de les imputer avec la commande imputePCA qui estime les valeurs manquantes à l’aide d’itérations d’ACP.
Ce graphique représente les inerties cumulées pour chaque dimension. La cassure dans la courbe (le coude) est nette, on peut alors sélectionner ici les 3 ou 4 premiers axes, qui explique 51.4% de la variance.
Nous observons tout d’abord des effets taille sur l’axe 1 et 2 : les variables se rassemble en formant un cône sur chaque axe. La corrélation des variables est ainsi positive aux axes.
Rock_n_Roll est très proche de l’axe 1 (le cos² sur l’axe 1 est grand) et éloigné du barycentre (proche du cercle de corrélation) donc Rock_n_Roll est très bien représenté sur l’axe 1 et sa contribution doit être bonne.
Les principales variables contribuant à l’axe 1 avec une bonne qualité de représentation sont :
Rock_n_RollClassiqueSwing-JazzRockAlternativeOperaMetal Hard_RockDans le même esprit, l’axe 2 forme un effet taille avec des variables bien représentées et contribuant bien à l’axe.
Les principales variables contribuant à l’axe 2 avec une bonne qualité de représentation sont :
DanceLatinoPopHipHop_RapInstrumentalEn vu de la construction des axes, le premier plan semble distinguer les musiques de type “récente”, peut-être plus appréciés par une population jeune, et une musique plus “ancienne” avec pour chaque style une histoire, des valeurs, regroupant des passionnés.
Afin de vérifier notre hypothèse nous allons étudier le nuage des individus.
Voici le nuage des individus. Chaque individu est colorié selon son appréciation à la musique Rock_n_Roll de 1 à 5.
Nous avons placé des ellipses qui se centrent selon la Distance euclidienne au barycentre.
On remarque bien ici que l’échelle d’appréciation est répartie tout au long de l’axe 1. À gauche, nous retrouvons des individus qui n’aime pas le Rock_n_Roll et à droite ceux qui l’apprécie. Quant au barycentre, on y retrouve les individus qui sont plutôt indifférents.
Même réflexion pour l’axe 2, on retrouve bien ces niveaux d’appréciation tout au long de l’axe allant de n’aime pas (en bas) à adore (en haut).
L’idée ici est de déterminer quels sont les individus qui se situent dans le quart gauche inférieur. De manière logique, on peut imaginer un axe fictif à la diagonale de l’axe 1 et 2 (d’en bas à gauche à en haut à droite) stipulant l’appréciation à la musique. Nous remarquons que de manière général les individus adorent la musique. (l’ellipse pour la note de 5 construite à partir des distances moyennes au barycentre est superposée au profil moyen).
En quelque sorte, les personnes qui apprécient les deux styles de musiques que nous avons différenciés en axe 1 et 2 se retrouvent dans le quart droit supérieur du nuage des individus, on tend à penser qu’ils apprécient plus la musique de manière générale et sont donc ouvert à tous styles de musiques.
Un moyen de vérifier cette interprétation de l’étude est de faire une classification et d’en étudier les classes, que nous effectuerons plus loin.
Nous avons représenté ici le nuage des variables et des individus, nous avons pris soint de colorier les varaibles selon leur contribution à l’axe 1. Nous voyons bien que deux groupes de musiques se distinguent.
Nous nous intéressons maintenant au deuxième plan.
En regardant les contributions on remarque que les variables qui contribuent le plus à l’axe 3 sont :
Rythme (11,2%)Reggea_ska (11%)Punk (10,6%)HipHop_Rap (10,3%)Opera (8,77%)On observe sur le nuage des variables que les 4 premières à contribuer à l’axe 3 s’opposent à Opera.
De manière générale, on observe sur l’axe 3 une opposition entre les musiques plus acoustique écoutées par une population plus attirée par les musiques douces avec des rythmes très variants et un emploi des instruments brut (Opera, Classique, Instrumental), et les musiques où le rythmes est très défini tout au long du morceau et où les sons des instruments sont assez travaillés et modifiés (Reggea_ska,HipHop_Rap,Punk).
Les variables qui contribuent le plus à l’axe 4 sont :
Reggea_ska (21%)Techno_Trance (16,4%)Swing_Jazz (7%)Opera (5,7%)On voit sur le nuage des variables que Reggea_ska et Swing_Jazz sont opposés sur l’axe 4 à Techno_Trance et Rythme. Ici l’axe 4 oppose clairement les musiques avec un rythme lent et un rythme rapide. On s’attend à ce que la contribution de la variable Rythme soit la plus forte sur ce plan puisqu’elle semble diriger notre interprétation des axes.
| Reggea_Ska | 32.089883 |
| Rythme | 27.258004 |
| Techno_Trance | 24.153370 |
| Opera | 14.506449 |
| Hiphop_Rap | 13.697404 |
| Punk | 10.667943 |
| Classique | 9.993544 |
| Dance | 9.978619 |
| Musique | 8.833331 |
| Metal_Hardrock | 8.824404 |
| Folk | 7.681440 |
| Swing_Jazz | 7.158128 |
| Rock | 6.595727 |
| Rock_n_Roll | 4.477265 |
| Latino | 4.374054 |
| Instrumental | 3.737298 |
| Alternative | 2.509186 |
| Country | 2.198056 |
| Pop | 1.265895 |
On observe que les deux variables qui contribuent le plus au plan sont Reggea_ska, réputé pour la lenteur du rythme, et Rythme, qui nous le rappelons lesquelles s’opposent sur l’axe 4. L’axe 4 représente une échelle de rythme allant de lent à rapide.
Tout d’abord, le premier plan de l’ACP distingue deux styles de musiques : un plus apprécié par les jeunes (axe 2) et une autre regroupant de nombreux passionnés qui sont des musiques plus anciennes, historiques(axe 1).
Concernant le deuxième plan, celui-ce caractérise le rythme et la construction des musiques.
Tout d’abord, on détermine le nombre de partition optimale à l’aide de la fonction clusGap, qui nous donne la valeur optimale de classe à l’aide du gap statistic, qui trouve le nombre maximisant l’écart dans la variance intra-groupes en introduisant un nouveau centroïde pour plusieurs itérations.
On voit sur ce graphiques que le nombre optimal de classe calculé est 3. Ainsi, on précise dans la fonction des kmeans que l’on désire 3 clusters. De plus, on utilise ici la méthode Forgy qui définit les 3 premiers centres de façon aléatoire, et on répète l’algorithme 50 fois pour obtenir un meilleur partitionnement.
Ici donc les 3 clusters que les K-means nous ont donné.
Ceux-ci expliquent 21.968% de l’inertie.
On peut observer que le découpage en 3 classes confirme l’analyse en ACP à savoir :
Nous allons effectuer une classification ascendante hiérarchique (méthode de WARD) à partir des résultat de l’ACP.
Ci-dessus, on présente le dendogramme correspondant à cette classification. On a laissé R choisir automatiquement le nombre de classes, et il en dégage 3 groupes, tout comme la méthode des K-means. De plus, on précise que notre CAH a été consolidé par les k-means, et nous donne un gain d’inertie de 0.62103%.
Enfin, le graphique représentant les classes générées par la CAH. Nous remarquons que le découpage des clusters n’est pas tout à fait le même qu’avec les K-means. Nous allons étudier les clusters ci-dessous grâce aux tableaux des statistiques.
| v.test | Mean in category | Overall mean | sd in category | Overall sd | p.value | |
|---|---|---|---|---|---|---|
| Hiphop_Rap | 7.945280 | 3.369723 | 2.910306 | 1.3316248 | 1.3728104 | 0.0000000 |
| Dance | 5.418794 | 3.381435 | 3.114730 | 1.1051294 | 1.1685331 | 0.0000001 |
| Pop | 4.636571 | 3.697995 | 3.471625 | 1.1443945 | 1.1591359 | 0.0000035 |
| Techno_Trance | 3.849122 | 2.554519 | 2.340555 | 1.3596652 | 1.3197479 | 0.0001185 |
| Rythme | 2.218801 | 3.406077 | 3.328252 | 0.8528578 | 0.8327547 | 0.0265002 |
| Musique | -3.402753 | 4.636766 | 4.731758 | 0.7892210 | 0.6627752 | 0.0006671 |
| Latino | -5.470367 | 2.537769 | 2.842494 | 1.2912527 | 1.3225261 | 0.0000000 |
| Reggea_Ska | -7.598180 | 2.382770 | 2.770042 | 1.1261899 | 1.2100922 | 0.0000000 |
| Country | -8.936310 | 1.720305 | 2.124315 | 0.7772956 | 1.0733613 | 0.0000000 |
| Instrumental | -10.567920 | 2.200608 | 2.761273 | 1.0701581 | 1.2595830 | 0.0000000 |
| Folk | -10.581316 | 1.780497 | 2.286814 | 0.9190099 | 1.1360433 | 0.0000000 |
| Punk | -13.241805 | 1.731485 | 2.455017 | 0.9869598 | 1.2972484 | 0.0000000 |
| Opera | -13.279335 | 1.477901 | 2.139547 | 0.7622357 | 1.1829378 | 0.0000000 |
| Metal_Hardrock | -14.075333 | 1.548915 | 2.361493 | 0.8562846 | 1.3706250 | 0.0000000 |
| Swing_Jazz | -15.057651 | 1.963406 | 2.759574 | 0.9706065 | 1.2553355 | 0.0000000 |
| Alternative | -15.129739 | 1.971220 | 2.827030 | 1.0188848 | 1.3429457 | 0.0000000 |
| Classique | -15.735485 | 2.129834 | 2.956806 | 0.9760924 | 1.2477370 | 0.0000000 |
| Rock | -16.607513 | 2.932772 | 3.759506 | 1.1376626 | 1.1818801 | 0.0000000 |
| Rock_n_Roll | -17.505956 | 2.229246 | 3.139433 | 0.9726098 | 1.2344045 | 0.0000000 |
Ci-dessus, le tableau montrant les statistiques des variables dans le cluster 1. Ce tableau nous permet de comparer la moyenne dans le cluster à la moyenne générale pour chaque variables.
Le cluster 1, d’après son positionnement sur le premier plan de l’ACP et les statistiques, regroupe les personnes appréciant les musiques “récentes” et aimant moins les musiques “anciennes”. On observe en effet dans la tableau que la moyenne d’appréciation dans la classe pour les variables Hip-Hop/Rap, Dance et Pop est beaucoup plus importantes que la moyenne général. De plus, c’est l’inverse que l’on observe avec des moyennes beaucoup plus faibles qu’en général sur les variables Rock_n_Roll, Rock et Classique.
Cela confirme l’interprétation que nous avions faite en ACP.
| v.test | Mean in category | Overall mean | sd in category | Overall sd | p.value | |
|---|---|---|---|---|---|---|
| Latino | 14.889462 | 3.693780 | 2.842494 | 1.092920 | 1.322526 | 0.0000000 |
| Instrumental | 14.720743 | 3.562857 | 2.761273 | 1.126457 | 1.259583 | 0.0000000 |
| Opera | 13.585240 | 2.834286 | 2.139547 | 1.202840 | 1.182938 | 0.0000000 |
| Folk | 12.892709 | 2.920000 | 2.286814 | 1.143628 | 1.136043 | 0.0000000 |
| Swing_Jazz | 12.748599 | 3.451429 | 2.759574 | 1.083215 | 1.255335 | 0.0000000 |
| Classique | 12.726845 | 3.643299 | 2.956806 | 1.085253 | 1.247737 | 0.0000000 |
| Country | 10.867095 | 2.628571 | 2.124315 | 1.173169 | 1.073361 | 0.0000000 |
| Dance | 8.746344 | 3.556564 | 3.114730 | 1.034020 | 1.168533 | 0.0000000 |
| Rock_n_Roll | 8.518080 | 3.593994 | 3.139433 | 1.030847 | 1.234404 | 0.0000000 |
| Pop | 7.579354 | 3.851429 | 3.471625 | 1.003244 | 1.159136 | 0.0000000 |
| Reggea_Ska | 6.464794 | 3.108235 | 2.770042 | 1.139097 | 1.210092 | 0.0000000 |
| Techno_Trance | 4.867606 | 2.618270 | 2.340555 | 1.325281 | 1.319748 | 0.0000011 |
| Hiphop_Rap | 3.581467 | 3.122857 | 2.910306 | 1.298039 | 1.372810 | 0.0003417 |
| Rock | 2.100442 | 3.866825 | 3.759506 | 1.000254 | 1.181880 | 0.0356900 |
| Punk | -2.450520 | 2.317589 | 2.455017 | 1.103458 | 1.297248 | 0.0142650 |
| Metal_Hardrock | -3.429446 | 2.158288 | 2.361493 | 1.119347 | 1.370625 | 0.0006048 |
Concernant le cluster 2, en appliquant la même méthode, hormis quelques variables (Latino et Instrumentale) les moyennes du cluster sont très similaires aux moyennes générales. Nous retrouvons bien nos individus qui apprécient la musique de manière générale.
| v.test | Mean in category | Overall mean | sd in category | Overall sd | p.value | |
|---|---|---|---|---|---|---|
| Metal_Hardrock | 18.378023 | 3.587248 | 2.361493 | 1.2852174 | 1.3706250 | 0.0000000 |
| Punk | 16.480171 | 3.495347 | 2.455017 | 1.1618321 | 1.2972484 | 0.0000000 |
| Rock | 15.270536 | 4.637747 | 3.759506 | 0.6097619 | 1.1818801 | 0.0000000 |
| Alternative | 13.876194 | 3.733838 | 2.827030 | 1.1869847 | 1.3429457 | 0.0000000 |
| Rock_n_Roll | 9.518942 | 3.711218 | 3.139433 | 1.0914288 | 1.2344045 | 0.0000000 |
| Classique | 3.265862 | 3.155099 | 2.956806 | 1.1455621 | 1.2477370 | 0.0010913 |
| Musique | 2.653421 | 4.817335 | 4.731758 | 0.5438899 | 0.6627752 | 0.0079680 |
| Swing_Jazz | 2.530447 | 2.914151 | 2.759574 | 1.2093062 | 1.2553355 | 0.0113917 |
| Folk | -2.326617 | 2.158195 | 2.286814 | 1.0066027 | 1.1360433 | 0.0199856 |
| Instrumental | -4.248104 | 2.500893 | 2.761273 | 1.1363971 | 1.2595830 | 0.0000216 |
| Techno_Trance | -9.126148 | 1.754465 | 2.340555 | 1.0511533 | 1.3197479 | 0.0000000 |
| Latino | -9.784032 | 2.212831 | 2.842494 | 1.0673936 | 1.3225261 | 0.0000000 |
| Hiphop_Rap | -12.091125 | 2.102581 | 2.910306 | 1.1369206 | 1.3728104 | 0.0000000 |
| Pop | -12.783605 | 2.750561 | 3.471625 | 1.0144763 | 1.1591359 | 0.0000000 |
| Dance | -14.823740 | 2.271812 | 3.114730 | 0.9286333 | 1.1685331 | 0.0000000 |
Toujours avec le même raisonnement, le cluster 3, lui, va à l’inverse du cluster 1, et regroupe les individus préférant les musiques “anciennes” aux musiques “récentes”, similairement à ce que nous avions estimé durant l’ACP.
L’ACP et les différentes méthodes de classification nous montrent une séparation nette entre les groupes. L’inertie inter-groupes se résume principalement dans les goûts musicaux, et plus particulièrement par l’ouverture globale à la musique des individus. De plus, elle nous révèle que les principales différences entre les individus se résument à leur préférence en terme de style musical et ce qui les composent en terme de caractéristiques (rythme, instruments, travail sonore). La classification a permis d’appuyer notre hypothèse en rangeant les individus dans des groupes expliqués par les axes. Nous avons de plus choisi de ne pas représenter les clusters sur les axes 3 et 4, car les deux axes sont tirés fortement par le rythme, empêchant une différenciation claire des groupes.
Nous nous demandons si les groupes en ACP sont déterminés plus précisément par une caractéristiques individuelles comme l’âge ou l’éducation par exemple.
| Déteste | N’aime Pas | Indifférent | Apprécie | Adore | |
|---|---|---|---|---|---|
| Licence | 34 | 52 | 55 | 31 | 40 |
| Primaire | 18 | 30 | 18 | 11 | 12 |
| Doctorat | 0 | 0 | 2 | 3 | 0 |
| Master | 5 | 16 | 23 | 25 | 12 |
| Collège/Lycée | 81 | 151 | 183 | 118 | 82 |
Ici est présenté le tableau de contingence qui croise les variables Education et les modalités de la variable concernant la musique Classique.
Nous avons renommé les modalités de 1 à 5 en niveaux d’appréciation classiquement utilisés dans les enquêtes.
On effectue tout d’abord un test du Chi² pour vérifier la pertinence d’effectuer une AFC ici. Le test nous retourne une p-value de 0.0042805. On peut alors rejeter l’hypothèse d’indépendance. Cependant, on obtient un avertissement concernant les valeurs et qu’ainsi l’approximation peut être incorrecte.
On peut utiliser simulate.p.value = TRUE pour simuler des valeurs de p-value par itération et appuyer notre premier résultat.
La p-value est de 0.003998. On rejette donc toujours l’hypothèse d’indépendance.
On peut donc effectuer l’AFC.
On remarque que l’information totale est résumée en 4 axes, ce qui est peu étonnant au vu de la faible quantité de cellules de notre tableau de contingence (5 profils colonnes, 5 profils lignes).
Le premier axe conserve à lui seul 80,5% d’inertie, cela signifie que 80,5% de la distance au Khi² est expliqué par le premier axe. Nous avons également 11,80% d’inertie au second ce qui nous donne une inertie au premier plan factoriel de 92,3%.
Nous nous limiterons à interpréter l’AFC sur ces deux axes.
De manière générale :
La catégorie Doctorat est très éloignée du profil moyen, elle semble être aussi bien représentée sur l’axe 1 que sur l’axe 2. Nous avons essayé de ré-effectuer cette AFC en mettant Doctoraten variable supplémentaire, mais cela ne changeait pas grand-chose.
Il semble que l’axe 2 soit tiré par les individus de la catégorie Licence.
La catégorie Collège/Lycée est proche du barycentre, donc est proche de l’individu moyen théorique dans la manière d’apprécier la musique classique.
Pour les contributions, on peut voir dans ce tableau que Master, Primaire et Doctorat contribue au Khi² sur l’axe 1 à hauteur d’environ 85% Pour l’axe 2, son inertie est en grande partie expliquée par le profil ligne Licence à hauteur de 55,5% et Primaire y contribue également à hauteur de 26,34%
Quant aux qualités de représentation, Doctorat est effectivement très bien représenté sur l’axe 1 mais il faut s’en méfier car cette catégorie comprend peu d’individus. De plus, nous voyons que globalement les profils lignes sont bien représentés sur l’axe 1 avec une bien meilleure qualité pour Master et Primaire.
Pour l’axe 2, c’est un peu différent, les qualités sont bien plus faibles. Tout porte à penser que l’axe 1 représente le niveau d’étude. On précisera tout de même que Licence et Collège sont mieux représenté sur l’axe 2 que les autres catégories.
| Contribution au premier plan | |
|---|---|
| Licence | 67.70171 |
| Primaire | 53.41409 |
| Master | 38.99637 |
| Doctorat | 28.26690 |
| Collège/Lycée | 11.62092 |
Nous remarquons que l’inertie total du premier plan factoriel provient en grande partie de Licence et Primaire.
Le nuage des profils colonnes est intéressant par sa structure, on voit bien que les mesure d’appréciation s’étendent le long de l’axe 1 allant de Apprécie à Déteste. Par ailleurs, ces deux catégories sont très opposées, on s’attend à ce qu’elles contribuent fortement à l’axe 1.
Chose plus étonnante Adore se détache et semble être plus représentée sur l’axe 2.
Comme nous l’avions pressenti, la contribution de Apprécie est forte à hauteur de 50,73% et Déteste à hauteur de 26,19%.
Les autres modalités contribuent beaucoup moins.
Comme observé, la contribution de la modalité Adore à l’axe 2 est très importante : 77,2%. A l’opposé, on a la modalité N'aime pas qui y contribue à hauteur de 19%.
Pour les représentations, Apprécie est très bien représenté sur l’axe 1 à ’l’instar de Déteste et N'aime pas. Pour l’axe 2, les qualités de représentation sont plutôt médiocres, hormis pour Adore avec 76%
On remarque que le profil Collège/lycée est assez proche du profil moyen avec un goût pour le classique plutôt neutre. Les étudiants en Licence quant à eux semblent se détacher de la même manière que la modalité Adore. Les Primaires semblent ne pas vraiment apprécier la musique classique. En Master, l’avis semblent de manière général tendre vers Apprécie.
Ainsi, on peut supposer que l’appréciation au classique est plus forte chez les étudiants en étude supérieur (licence et plus). A considérer que Doctorat est mal représenté dans la population et ne définit donc pas une généralité concernant ce niveau d’étude. De plus, il est important de rappeler que, globalement, le niveau d’étude est fortement corrélé avec l’âge, et que celui-ci doit aussi avoir son influence.
Maintenant, nous allons nous intéresser au lien entre l’âge des individus répartis en classe et le style Hip-Hop/Rap. Après de nombreux essais concernant la séparation des classes d’âge, nous avons décider de garder 3 classes d’âge découpé en 5 années chacune. On rappelle que la population étudiée s’étale de 15 à 30 ans. Nous avons remarqué que de multiples classes homogénéisait la population et ne permettait pas de faire ressortir l’inertie inter-groupes. On s’attend donc à une AFC qui exprime l’inertie en très peu d’axes.
| Déteste | N’aime Pas | Indifférent | Apprécie | Adore | |
|---|---|---|---|---|---|
| Entre 15 et 20 ans | 121 | 128 | 131 | 148 | 89 |
| Entre 20 et 25 ans | 64 | 68 | 61 | 65 | 57 |
| Entre 25 et 30 ans | 26 | 10 | 11 | 10 | 10 |
Comme pour l’AFC précédente, on effectue un test du Khi² pour vérifier que notre AFC est valable. Ici, la p-value est de 0.0260941, on rejette alors l’hypothèse d’indépendance et on peut valider notre AFC.
| eigenvalue | percentage of variance | cumulative percentage of variance | |
|---|---|---|---|
| dim 1 | 0.0144724 | 83.03441 | 83.03441 |
| dim 2 | 0.0029570 | 16.96559 | 100.00000 |
On remarque que l’information totale est résumée en 2 axes, ce qui est peu étonnant au vu de la faible quantités de cellules de notre tableau de contingence (5 profils colonnes, 3 profils lignes).
Le premier axe conserve à lui seul 83%d’inertie, cela signifie que 83% de la distance au Khi² est expliquée par ce dernier. Nous avons également 17% d’inertie au second axe. Soit comme nous l’avions pensé, l’inertie se résume en très peu d’axes, ici deux.
Le diagramme des inerties confirme notre analyse.
Nous voyons que les profils lignes s’éloignent du profil moyen de manière disjointe. Effectivement, la catégorie [20-25] semble contribuer de manière très forte à l’axe 2. Contrairement aux catégories [15-20] et [25-30] qui s’opposent sur l’axe 1.
On s’attend donc à ce que l’axe 1 soit formé par les catégories [15-20] et [25-30] Et que l’axe 2 soit formé en grande partie par l’inertie du profil ligne [20-25].
On peut voir que les catégories [25-30] et [15-20] contribue à l’axe 1 pour plus de 99.9%. On remarque bien évidement que la classe [20-25] ne contribue pas du tout à l’axe 1.
L’axe 2 trouve son inertie en grande partie par le profil ligne [20-25] à hauteur de 68,5% et la modalité [15-20] y contribue également à hauteur de 28.5%.
Pour les qualités de représentation, on s’attendait à ce que la classe [20-25] soit très mal représentée sur l’axe 1. Cependant comme prévu, les qualités de représentation des modalités [25-30] et [15-20] sont très bien élevées sur l’axe 1.
Quant à l’axe 2, nous avions remarqué que la classe [20-25] était bien représentée sur l’axe 2 et était très éloignée du profil moyen. De ce fait, la qualité de représentation étant le carré de sa coordonnée, elle est très importante.
| x | |
|---|---|
| Entre 25 et 30 ans | 93.29329 |
| Entre 20 et 25 ans | 68.46847 |
| Entre 15 et 20 ans | 38.23824 |
Nous remarquons que l’inertie totale du premier plan factoriel provient en grande partie des classes [25-30] et [20-25] qui nous le rappelons expliquent chacune un axe distinct.
Le nuage des profils colonnes se distingue principalement le long des axes, en regardant quels profils colonnes sont proches d’un axe et éloignés du profil moyen, on peut remarquer que l’axe 1 est plutôt porté sur le fait d’aimer ou non le Hip-Hop (de gauche à droite sur l’axe 1 pour les modalités Apprécie et Déteste).
On voit que le profil Déteste semble tiré l’axe 1, il doit beaucoup contribuer.
Inversement avec l’axe 2, qui semble trouver son inertie avec la modalité Adore et peut-être Apprécie. Cela ne sont cependant que des hypothèses à vérifier par la suite.
Comme nous l’avions pressenti, la contribution pour l’axe 1 de Déteste est forte à hauteur de 73% et Apprécie à hauteur de 15.3%. Ainsi, l’hypothèse que nous avions faite au départ semble se confirmer concernant la signification de l’axe 1. Les autres modalités sont bien moins représentées.
Pour l’axe 2, comme observé, la contribution à l’inertie de la modalité Adore est très importante avec 61,3%. Le profil colonne Apprécie contribue à la distance au Khi² à hauteur de 20%. On note d’ailleurs que ce profil contribue aux deux axes dans des proportions assez proches.
Quand aux représentation, sur l’axe 1 le profil Déteste est très bien représenté avec une valeur de 0.987, ainsi que N'aime pas avec 0.827 et aussi, Apprécie et Indifférent avec environ 0.77 chacun. Sur l’axe 2, les qualités de représentation sont plutôt médiocres hormis pour Adore avec 0.99.
Globalement, les individus entre 15 et 20 ans apprécie plutôt le Hip-Hop/Rap (qualité de représentation plus élevée que Indifférent). Pour les individus entre 25 et 30 ans, il semblerait que ceux-ci déteste globalement ce style. Et enfin, que ce style soit adoré chez les 20/25 ans. On remarque donc comme la précédente AFC, un lien certain antre l’âge et l’appréciation de certains styles musicaux. On peut penser que cela s’explique par les années dans lesquelles sont nées ces individus. En effet, l’étude ayant été fait en 2013, montre que chaque groupe est né et a grandi dans des ères musicales différents.
Nous allons maintenant effectuer une ACM avec les variables suivantes:
Similairement à l’ACP, nous avons d’abord imputer la base de données à l’aide de la fonction imputeMCA qui estime les valeurs manquantes par une itération d’ACM.
Suite à des différents essais de choix de variables pour l’ACM nous donnant des inerties peu différenciées en axes (pas de cassure), nous avons décidé de conserver les styles de musiques les plus représentatif des clusters dans l’ACP. Effectivement, un gain d’inertie sur les premiers axes est ressenti, et une différenciation drastique des inerties aux dimensions plus lointaines.
Ce premier graphique représente les inerties pour chaque axes factoriels.
On peut alors sélectionner ici les 3/4 premiers axes, qui explique 23.6% de l’inertie Nous aviserons évidemment en fonction du nombre d’axes que nous arriverons à interpréter.
Nous allons d’abord ici regarder la répartition des modalités sur les axes, puis leur contribution et leur qualités.
On remarque plusieurs choses sur ces graphiques.
Tout d’abord, on peut supposer que l’axe 1 est déterminé par les niveaux d’appréciation, en effet, les valeurs s’étalent de 1 à 5 en allant de gauche à droite.
Quant à l’axe 2, on peut supposer au vu des contributions ci-dessous que celui-ci est dirigé par l’instrumentalisation et les sonorités utilisées dans les musiques, de sonorités naturelles, pures à des sonorités plus artificielles, voir électroniques.
De plus, il est important de noter un effet Guttman au vu de la dispersion des modalités sur les axes 1 et 2. En effet, il doit y avoir un jeu d’interactions entre les deux axes formant ce U assez distinct sur le graphique. Ce problème est favorisé lorsque l’analyse porte sur des variables avec un nombre impair de modalités, donc avec une modalité médiane : c’est le cas des échelles de 0 à 5 où la modalité 3 est médiane
Pour l’axe 1, les variables qui contribuent le plus sont celles que nous avons dit plus haut à savoir le Classique_1, le Swing_jazz_1, l’Instrumental_1 et aussi le Opera_1 et pour toutes avec la modalité 1. Cela appuie notre hypothèse de l’axe définit par les appréciations.
Pour l’axe 2, les variables qui contribuent le plus sont la Classique_5, le Opera_5, le Hip-Hop/rap_1 et Dance_1. On voit bien une opposition d’appréciation entre le côté naturel ou non des sonorités utilisées.
Pour la qualité de représentation, on retrouve semblablement les mêmes conclusions que pour la contributions aux axes. Les variables les plus éloignées du barycentre vont avoir une meilleure qualité de représentation et sont les mêmes contribuant aux axes.
Passons maintenant à la représentation des individus dans l’espace pour voir la répartition des individus sur les axes.
La répartition des individus semblent suivre les modalités. on peut sortir certains individus et les valeurs qu’ils prennent dans ces modalités pour se donner une idée des axes.
| Dance | Pop | Hiphop_Rap | Classique | Swing_Jazz | Rock_n_Roll | Instrumental | Latino | Opera | Genre | Education | Age_cat | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 771 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | Femme | Licence | Entre 15 et 20 ans |
| 547 | 3 | 4 | 2 | 5 | 5 | 5 | 5 | 5 | 5 | Homme | Master | Entre 25 et 30 ans |
| 825 | 1 | 3 | 1 | 5 | 2 | 5 | 1 | 2 | 5 | Femme | Licence | Entre 25 et 30 ans |
| 449 | 4 | 4 | 4 | 2 | 2 | 4 | 2 | 2 | 2 | Femme | Collège/Lycée | Entre 15 et 20 ans |
Le tableau ci-dessus met en valeurs 4 individus, chacun représentant une extrémité d’un axe auquel chacun contribue grâce au graphique précédent :
Les valeurs qu’ils prennent tendent à confirmer notre interprétation des axes 1 et 2.
Au vu des variables qualitatives et des valeurs prises par les individus contribuant le plus. On tend à confirmer nos hypothèses concernant les axes 1 et 2 :
Nous avons tenter d’interpréter les axes 3 et 4, mais ils n’en ressortaient aucune informations claires. Nos deux axes expliquent donc 11% de l’inertie.
Nous allons effectuer une classification ascendante hiérarchique à partir de l’ACM vu précédemment, et essayer d’identifier des groupes d’individu.
Le dendogramme ci-dessus nous montre la répartition des individus en 3 groupes. Le choix de ce nombre a été fait automatiquement par R et semble après d’autres essais être le plus convaincant.
Ce graphique montre la répartition des clusters sur les dimensions 1 et 2.
Ce tableau nous montre quelle modalité caractérise au mieux une classe en comparant la proportion de cette modalité dans la classe et la proportion de cette modalité dans la population globale.
| Cla/Mod | Mod/Cla | Global | p.value | v.test | |
|---|---|---|---|---|---|
| Swing_Jazz=Swing_Jazz_1 | 80.097087 | 59.7826087 | 20.396040 | 0.0000000 | 18.214417 |
| Opera=Opera_1 | 57.435897 | 81.1594203 | 38.613861 | 0.0000000 | 17.145647 |
| Classique=Classique_1 | 86.956522 | 43.4782609 | 13.663366 | 0.0000000 | 16.020119 |
| Instrumental=Instrumental_1 | 72.081218 | 51.4492754 | 19.504950 | 0.0000000 | 14.912357 |
| Latino=Latino_1 | 69.270833 | 48.1884058 | 19.009901 | 0.0000000 | 13.731477 |
| Rock_n_Roll=Rock_n_Roll_1 | 78.632479 | 33.3333333 | 11.584158 | 0.0000000 | 12.391096 |
| Dance=Dance_1 | 61.702128 | 21.0144928 | 9.306931 | 0.0000000 | 7.333755 |
| Pop=Pop_1 | 68.333333 | 14.8550725 | 5.940594 | 0.0000000 | 6.799542 |
| Rock_n_Roll=Rock_n_Roll_2 | 43.523316 | 30.4347826 | 19.108911 | 0.0000001 | 5.413223 |
| Genre=Homme | 33.495146 | 50.0000000 | 40.792079 | 0.0002883 | 3.625635 |
| Hiphop_Rap=Hiphop_Rap_1 | 35.981308 | 27.8985507 | 21.188119 | 0.0017348 | 3.132237 |
| Hiphop_Rap=Hiphop_Rap_5 | 37.341772 | 21.3768116 | 15.643564 | 0.0027560 | 2.993723 |
| Education=Primaire | 37.777778 | 12.3188406 | 8.910891 | 0.0237848 | 2.260588 |
| Hiphop_Rap=Hiphop_Rap_2 | 21.739130 | 16.3043478 | 20.495050 | 0.0410848 | -2.042673 |
| Hiphop_Rap=Hiphop_Rap_4 | 21.333333 | 17.3913043 | 22.277228 | 0.0206389 | -2.314526 |
| Classique=Classique_3 | 20.350877 | 21.0144928 | 28.217822 | 0.0015580 | -3.163658 |
| Pop=Pop_4 | 20.569620 | 23.5507246 | 31.287129 | 0.0009936 | -3.292336 |
| Latino=Latino_3 | 19.166667 | 16.6666667 | 23.762376 | 0.0009189 | -3.314258 |
| Dance=Dance_3 | 20.061728 | 23.5507246 | 32.079208 | 0.0003063 | -3.609889 |
| Genre=Femme | 23.076923 | 50.0000000 | 59.207921 | 0.0002883 | -3.625635 |
| Rock_n_Roll=Rock_n_Roll_5 | 15.568862 | 9.4202899 | 16.534654 | 0.0001052 | -3.878386 |
| Opera=Opera_5 | 3.773585 | 0.7246377 | 5.247525 | 0.0000071 | -4.490854 |
| Latino=Latino_5 | 10.526316 | 5.7971014 | 15.049505 | 0.0000001 | -5.407068 |
| Rock_n_Roll=Rock_n_Roll_3 | 15.894040 | 17.3913043 | 29.900990 | 0.0000000 | -5.488035 |
| Opera=Opera_4 | 6.122449 | 2.1739130 | 9.702970 | 0.0000000 | -5.523931 |
| Swing_Jazz=Swing_Jazz_5 | 6.000000 | 2.1739130 | 9.900990 | 0.0000000 | -5.625811 |
| Instrumental=Instrumental_4 | 9.638554 | 5.7971014 | 16.435644 | 0.0000000 | -6.032573 |
| Instrumental=Instrumental_3 | 14.134276 | 14.4927536 | 28.019802 | 0.0000000 | -6.106174 |
| Classique=Classique_5 | 8.108108 | 4.3478261 | 14.653465 | 0.0000000 | -6.205193 |
| Swing_Jazz=Swing_Jazz_3 | 13.186813 | 13.0434783 | 27.029703 | 0.0000000 | -6.419613 |
| Rock_n_Roll=Rock_n_Roll_4 | 11.255411 | 9.4202899 | 22.871287 | 0.0000000 | -6.623829 |
| Instrumental=Instrumental_5 | 4.310345 | 1.8115942 | 11.485148 | 0.0000000 | -6.723973 |
| Opera=Opera_3 | 6.857143 | 4.3478261 | 17.326733 | 0.0000000 | -7.367565 |
| Classique=Classique_4 | 7.407407 | 5.0724638 | 18.712871 | 0.0000000 | -7.467645 |
| Swing_Jazz=Swing_Jazz_4 | 7.035176 | 5.0724638 | 19.702970 | 0.0000000 | -7.871225 |
| Opera=Opera_2 | 10.884354 | 11.5942029 | 29.108911 | 0.0000000 | -7.941478 |
| Latino=Latino_4 | 5.232558 | 3.2608696 | 17.029703 | 0.0000000 | -7.999356 |
Le cluster 1 est celui regroupant le plus de personnes prenant des modalités 1 pour beaucoup de styles de musiques, voir tous. Ce sont principalement les gens n’aimant vraiment pas un style ou plusieurs. Le cluster se situe à gauche sur l’axe 1 de l’ACM, cela tend à renforcer notre interprétation de celui-ci.
| Cla/Mod | Mod/Cla | Global | p.value | v.test | |
|---|---|---|---|---|---|
| Opera=Opera_2 | 80.272109 | 43.1444241 | 29.1089109 | 0.0000000 | 10.966475 |
| Classique=Classique_3 | 75.789474 | 39.4881170 | 28.2178218 | 0.0000000 | 8.811563 |
| Instrumental=Instrumental_3 | 75.265018 | 38.9396709 | 28.0198020 | 0.0000000 | 8.548463 |
| Rock_n_Roll=Rock_n_Roll_3 | 74.172185 | 40.9506399 | 29.9009901 | 0.0000000 | 8.466254 |
| Swing_Jazz=Swing_Jazz_3 | 73.992674 | 36.9287020 | 27.0297030 | 0.0000000 | 7.821167 |
| Pop=Pop_4 | 68.670886 | 39.6709324 | 31.2871287 | 0.0000000 | 6.293857 |
| Dance=Dance_3 | 68.209876 | 40.4021938 | 32.0792079 | 0.0000000 | 6.202596 |
| Latino=Latino_4 | 75.000000 | 23.5831810 | 17.0297030 | 0.0000000 | 6.138003 |
| Swing_Jazz=Swing_Jazz_2 | 71.120690 | 30.1645338 | 22.9702970 | 0.0000000 | 5.978407 |
| Opera=Opera_3 | 71.428571 | 22.8519196 | 17.3267327 | 0.0000003 | 5.107202 |
| Classique=Classique_4 | 68.783069 | 23.7659963 | 18.7128713 | 0.0000063 | 4.514885 |
| Classique=Classique_2 | 66.400000 | 30.3473492 | 24.7524752 | 0.0000067 | 4.503568 |
| Latino=Latino_3 | 66.666667 | 29.2504570 | 23.7623762 | 0.0000074 | 4.480857 |
| Dance=Dance_4 | 66.525424 | 28.7020110 | 23.3663366 | 0.0000118 | 4.381175 |
| Hiphop_Rap=Hiphop_Rap_4 | 66.222222 | 27.2394881 | 22.2772277 | 0.0000344 | 4.142304 |
| Rock_n_Roll=Rock_n_Roll_4 | 65.800866 | 27.7879342 | 22.8712871 | 0.0000482 | 4.064198 |
| Instrumental=Instrumental_4 | 66.867470 | 20.2925046 | 16.4356436 | 0.0002981 | 3.616932 |
| Instrumental=Instrumental_2 | 62.500000 | 28.3363803 | 24.5544554 | 0.0023602 | 3.040710 |
| Hiphop_Rap=Hiphop_Rap_2 | 61.835749 | 23.4003656 | 20.4950495 | 0.0128231 | 2.488645 |
| Latino=Latino_2 | 60.629921 | 28.1535649 | 25.1485149 | 0.0167044 | 2.393150 |
| Education=Doctorat | 100.000000 | 0.9140768 | 0.4950495 | 0.0462035 | 1.993530 |
| Pop=Pop_2 | 45.806452 | 12.9798903 | 15.3465347 | 0.0240554 | -2.256244 |
| Opera=Opera_4 | 41.836735 | 7.4954296 | 9.7029703 | 0.0105134 | -2.558469 |
| Latino=Latino_5 | 42.763158 | 11.8829982 | 15.0495050 | 0.0023400 | -3.043296 |
| Swing_Jazz=Swing_Jazz_5 | 38.000000 | 6.9469835 | 9.9009901 | 0.0006805 | -3.397320 |
| Dance=Dance_5 | 37.588653 | 9.6892139 | 13.9603960 | 0.0000223 | -4.240667 |
| Rock_n_Roll=Rock_n_Roll_5 | 34.131737 | 10.4204753 | 16.5346535 | 0.0000000 | -5.678629 |
| Hiphop_Rap=Hiphop_Rap_1 | 33.644860 | 13.1627057 | 21.1881188 | 0.0000000 | -6.784787 |
| Instrumental=Instrumental_5 | 23.275862 | 4.9360146 | 11.4851485 | 0.0000000 | -7.164462 |
| Pop=Pop_1 | 6.666667 | 0.7312614 | 5.9405941 | 0.0000000 | -8.037016 |
| Opera=Opera_5 | 1.886793 | 0.1828154 | 5.2475248 | 0.0000000 | -8.529835 |
| Opera=Opera_1 | 36.923077 | 26.3254113 | 38.6138614 | 0.0000000 | -8.737289 |
| Dance=Dance_1 | 10.638298 | 1.8281536 | 9.3069307 | 0.0000000 | -9.255664 |
| Rock_n_Roll=Rock_n_Roll_1 | 11.965812 | 2.5594150 | 11.5841584 | 0.0000000 | -10.098516 |
| Latino=Latino_1 | 20.312500 | 7.1297989 | 19.0099010 | 0.0000000 | -10.628962 |
| Instrumental=Instrumental_1 | 20.812183 | 7.4954296 | 19.5049505 | 0.0000000 | -10.631101 |
| Classique=Classique_5 | 14.189189 | 3.8391225 | 14.6534653 | 0.0000000 | -10.881097 |
| Classique=Classique_1 | 10.144927 | 2.5594150 | 13.6633663 | 0.0000000 | -11.652078 |
| Swing_Jazz=Swing_Jazz_1 | 13.106796 | 4.9360146 | 20.3960396 | 0.0000000 | -13.694055 |
Le cluster 2, lui regroupe les modalités 3 et 4, ce sont des gens qui apprécient la musique en général, mais ont aussi une tendance à préférer légèrement les musiques au sonorités modernes, travaillés, artificielles avec des modalités légérement supérieure pour Popet Latino.
| Cla/Mod | Mod/Cla | Global | p.value | v.test | |
|---|---|---|---|---|---|
| Classique=Classique_5 | 77.702703 | 61.497326 | 14.653465 | 0.0000000 | 17.702343 |
| Instrumental=Instrumental_5 | 72.413793 | 44.919786 | 11.485148 | 0.0000000 | 13.817015 |
| Opera=Opera_5 | 94.339623 | 26.737968 | 5.247525 | 0.0000000 | 12.485303 |
| Rock_n_Roll=Rock_n_Roll_5 | 50.299401 | 44.919786 | 16.534654 | 0.0000000 | 10.474277 |
| Swing_Jazz=Swing_Jazz_5 | 56.000000 | 29.946524 | 9.900990 | 0.0000000 | 8.944162 |
| Latino=Latino_5 | 46.710526 | 37.967914 | 15.049505 | 0.0000000 | 8.802203 |
| Opera=Opera_4 | 52.040816 | 27.272727 | 9.702970 | 0.0000000 | 7.960679 |
| Swing_Jazz=Swing_Jazz_4 | 35.175879 | 37.433155 | 19.702970 | 0.0000000 | 6.340116 |
| Hiphop_Rap=Hiphop_Rap_1 | 30.373832 | 34.759358 | 21.188119 | 0.0000016 | 4.796921 |
| Dance=Dance_5 | 34.042553 | 25.668449 | 13.960396 | 0.0000018 | 4.778409 |
| Pop=Pop_5 | 28.310502 | 33.155080 | 21.683168 | 0.0000513 | 4.049495 |
| Genre=Femme | 21.739130 | 69.518717 | 59.207921 | 0.0013428 | 3.206670 |
| Dance=Dance_1 | 27.659575 | 13.903743 | 9.306931 | 0.0221322 | 2.288091 |
| Dance=Dance_2 | 23.720930 | 27.272727 | 21.287129 | 0.0303561 | 2.165412 |
| Classique=Classique_4 | 23.809524 | 24.064171 | 18.712871 | 0.0423962 | 2.029610 |
| Latino=Latino_3 | 14.166667 | 18.181818 | 23.762376 | 0.0441915 | -2.012270 |
| Hiphop_Rap=Hiphop_Rap_4 | 12.444444 | 14.973262 | 22.277228 | 0.0063546 | -2.728902 |
| Rock_n_Roll=Rock_n_Roll_1 | 9.401709 | 5.882353 | 11.584158 | 0.0044684 | -2.843050 |
| Swing_Jazz=Swing_Jazz_3 | 12.820513 | 18.716577 | 27.029703 | 0.0037504 | -2.898423 |
| Genre=Homme | 13.834952 | 30.481283 | 40.792079 | 0.0013428 | -3.206670 |
| Latino=Latino_1 | 10.416667 | 10.695187 | 19.009901 | 0.0008011 | -3.352425 |
| Latino=Latino_2 | 11.023622 | 14.973262 | 25.148515 | 0.0002313 | -3.682088 |
| Dance=Dance_3 | 11.728395 | 20.320856 | 32.079208 | 0.0000896 | -3.917250 |
| Dance=Dance_4 | 10.169491 | 12.834225 | 23.366337 | 0.0000819 | -3.938680 |
| Instrumental=Instrumental_3 | 10.600707 | 16.042781 | 28.019802 | 0.0000276 | -4.192583 |
| Pop=Pop_4 | 10.759494 | 18.181818 | 31.287129 | 0.0000096 | -4.426398 |
| Rock_n_Roll=Rock_n_Roll_3 | 9.933775 | 16.042781 | 29.900990 | 0.0000018 | -4.774789 |
| Instrumental=Instrumental_1 | 7.106599 | 7.486631 | 19.504950 | 0.0000007 | -4.957649 |
| Instrumental=Instrumental_2 | 8.064516 | 10.695187 | 24.554455 | 0.0000002 | -5.188017 |
| Swing_Jazz=Swing_Jazz_1 | 6.796117 | 7.486631 | 20.396040 | 0.0000002 | -5.251288 |
| Opera=Opera_2 | 8.843537 | 13.903743 | 29.108911 | 0.0000001 | -5.330204 |
| Classique=Classique_1 | 2.898551 | 2.139037 | 13.663366 | 0.0000000 | -5.855169 |
| Rock_n_Roll=Rock_n_Roll_2 | 4.663212 | 4.812834 | 19.108911 | 0.0000000 | -6.132986 |
| Swing_Jazz=Swing_Jazz_2 | 5.172414 | 6.417112 | 22.970297 | 0.0000000 | -6.560909 |
| Classique=Classique_2 | 4.800000 | 6.417112 | 24.752475 | 0.0000000 | -7.100899 |
| Classique=Classique_3 | 3.859649 | 5.882353 | 28.217822 | 0.0000000 | -8.357494 |
| Opera=Opera_1 | 5.641026 | 11.764706 | 38.613861 | 0.0000000 | -8.904655 |
Quant au cluster 3, ce sont les individus qui apprécient beaucoup les styles de musiques aux sonorités naturelles avec des modalité 5 pour la plupart des variables. De plus, le cluster se situent dans le coin supérieur droit du graphique, appuyant ainsi nos interprétations des axes.
Les clusters définit par la CAH tendent à confirmer les interprétations que nous avions faites des axes de l’ACM. De plus, les clusters s’intersectionnent au niveau du profil moyen, c’est à dire des notes moyennes, et aucune préférence pour un type de sonorité. Les individus qui sont à l’intersection des clusters 2 et 3, sont les individus qui apprécient beaucoup la musique en général sans distinction de sonorité, qui sont donc ouvert à tout.